若手研究者による『統計・機械学習の今後』に向けた挑戦：響き合う人とデータ―統数研プロジェクト：統計数理研究所

統計数理研究所には、日々膨大なデータと格闘し、数理の力で世界の理を解き明かそうとする研究者たちが集う。生成AIの爆発的な普及により、社会のあり方が劇的に変わろうとしている今、統計学や機械学習の研究現場ではどのような変化が起きているのだろうか。今回は、統数研の次代を担う3人の若手研究者に、現在の研究の最前線と自らが描く「統計・機械学習の今後」について話を聞いた。

これからのAI・機械学習は科学のために何ができるか

機械学習、特に深層学習の発展は目覚ましく、画像認識やタンパク質構造予測など、多くの分野で人間を凌駕する精度を叩き出している。近年はそうしたAIに関する技術の進歩を背景として、バイオテクノロジー分野や材料科学分野などさまざまな科学研究にAIが活用されている（図1）。「AI for Science」や「AI in Science」と呼ばれるこの取り組みにより、科学的な課題解明の加速や研究の生産性向上への期待が高まっている。

図1：情報科学分野以外の分野での、AIや機械学習の用語に言及した論文数も増加している（出典：科学技術振興機構研究開発戦略センター）。

統計数理研究所でも多くの研究者がこのテーマに関心を寄せており、2026年1月には「機械学習・統計数理が切り拓くAI for Scienceの新展開」をテーマとするシンポジウムを開催したところだ。

だが、AIの急激な進化のスピードは、人間の手法開発スピードを超えつつある。統計基盤数理研究系の矢野恵佑准教授は「統計学や機械学習はもともと科学と協調して進化してきた側面があります。ただ、そこにAIが登場したことで、これらの手法を開発する人たちが、これから進むべき方向を模索し、混迷を極めているのが現在の状況です」と指摘する。

「われわれ数理の研究者側も、この問題に対し能動的に関わる時期に来ている、というのが私たちの共通した課題意識です」と矢野は話す。

三者三様の切り口で挑むAI・機械学習の課題

矢野とAIや機械学習に関わる課題意識を共有しているのが、包含（つつみ・ふくむ）准教授と奥野彰文准教授だ。

3人の専門はそれぞれ異なる。矢野は博士課程では統計学や機械学習の理論、つまりデータ解析の手法がどのような数理的性質を有するかといった理論研究をしていた。

転機が訪れたのは、東京大学の助教となった2017年。地震学者・測地学者との共同研究をきっかけに、統計学・機械学習の理論を応用の現場へ持ち込むことに興味が湧いた。その思いは、2020年に統数研に着任した後も現在まで続いている。

「地震学やプラズマ物理学、さらには生態学など、さまざまな応用現場を渡り歩く『流浪の統計学者』になることが私の理想です」と矢野は笑う。流浪の果てに、それらの背後にある共通点を抽出できないかというのが本当の狙いだ。

矢野と同じく統計基盤数理研究系に所属する奥野は「伝統的な統計学と人工知能のちょうど中間に位置する人間です」と自己紹介する。

「伝統的な統計学は、データが少なくても、そこに意味のある知見を引き出す（汎化）方法を洗練させてきました。例えば、50年ほど前から使われている赤池情報量規準（AIC）のようなモデル選択の技術があります」と奥野は続ける。

しかし、これらを現代の非常に複雑で非線形なニューラルネットワークにそのまま適用するのは難しくなっている。「私は、古典的な知見を現代版にアップデートし、最新のツールを統計学のフレームワークでより使いやすくする研究を進めています」（図2）。過去の知の遺産を最新技術の土台として再構築しようというのが、奥野のテーマだ。

図2：Widely-Applicable Information Criterion (WAIC; Watanabe, JMLR2010)は、統数研元所長の赤池弘次氏が1970年に確立した「赤池情報量規準（AIC）」を特異モデルにも使えるようにした規準。奥野らの研究によって、そのWAICが巨大モデルにも利用できることが証明された。

一方、先端データサイエンス研究系に所属し、コンピュータサイエンスを専門とする包は「今はビッグデータが簡単に手に入りますが、巨大なモデルに大量のデータを投入すればそれだけですべてが解決する、というわけではありません」と警鐘を鳴らす。

「現在のニューラルネットワークは、古典的な統計モデルが巨大化した“お化け”のようなもので、本質的な性質は変わりません。高速な計算で学習を繰り返すことで精度が上がる反面、人間には判別できないような微小なノイズを加えるだけで予測が狂ってしまう。『敵対的攻撃』に対しては非常に脆い側面があります」と、包は指摘する。この問題は、単なる技術的な欠陥に留まらず、自動運転や医療診断など人の命に関わる分野では、社会実装における大きな障壁となる。

「アルゴリズムが人種や性別に対して偏見を持つ『公平性』に関わる課題も、データを大きくすれば解決する性質のものではありません。むしろ、社会に内在するリスクがそのままモデルに反映されてしまう危険性がある。私は、単に予測性能を上げるだけでなく、どうすればこうした課題を解決し、信頼できるモデルを構築できるかに興味を持っています」（包）。

諸科学を繋ぐ統計数理で「メタ科学」を深化させる

3人が共通して言及するキーワードの一つが、「メタ科学」だ。個別の現象を解析するだけでなく、よいモデルが成立する背後の法則を科学的に探求する姿勢、すなわち「科学の科学」を意味する。

「前述のように、一見、全く異なる分野であっても、背後にある数理構造には共通性があります。例えば、地震の発生間隔を記述するモデルが、プラズマ物理における粒子の突発的な動きの解析に応用できることが分かってきました」と、矢野はその可能性に言及する。

包は「メタ科学的に考えると面白いことがいろいろあります」と話す。ある現象を予測する統計モデルの当てはまりがよいとき、その背後にある法則とは何なのか。例えば、線形回帰の場合、回帰関数のパラメータに対して予測誤差を対応付けたランドスケープとして表せる。

「機械学習の学習過程の予測誤差の変化を一つのランドスケープとして捉えると、それは『坂道を転がり落ちるボールの動き』のような、力学的な運動方程式と似た構造を持っています。物理学が長年積み上げてきた知見をAIの理解に応用することで、ブラックボックス化しがちな機械学習の内部を解明できる可能性があるのです」と説明する（図3）。

図3：予測誤差を（a,b）の関数として記述し、パラメータを調整して予測誤差の「谷」を下り、関数の最小点を見つける最適化のアプローチ。この動きは「坂道を転げ落ちるボール」の運動と類似する。

包はこれを「AIを科学のために使う＝AI for Science」の逆、つまり「科学の知見をAIの理解に役立てる＝Science for AI」と位置づける。

「私は面白い問題があれば何でもやるというスタンスです」と話す奥野もまた、領域横断的な交流から新たな着想を得ている。「最近ではスーパーコンピュータなど数値解析の専門家や数学の専門家たちとも話をしています。統計学は基本的にどのような分野にも関わることができるので、他の分野の技術を統計学に取り入れたり、逆に統計学のテクニックを他分野に輸出したりすることで、これまで解けなかった問題が解けるようになることもある。その瞬間が非常に面白いですね」（奥野）。

矢野は「統計数理という共通言語を通じて諸科学を俯瞰することで、より深いメカニズムの理解が可能になります。データや結果の信頼性を評価する手法を開発し、未知のデータに対してどの程度当てはまるかを定量化することで、科学的な推論の質を高めていきたい」と展望を語る（図4）。

図4：矢野が関連する「AI時代に役立つ統計数理」の2つの例。使用したデータの影響度や学習したモデルの学習外のデータでの性能を探る「データ＆モデルの信頼性と汎化評価」。従来の統計解析では難しい混合ドメイン（マルチモーダル）のデータの従属性をデータ駆動的に抽出する「マルチモーダルデータにおける従属性評価」。

AI時代の問いの立て方、人間が担うべき「目利き」の力

AIが高度な解決策を瞬時に提示する時代において、研究者自身の役割も変化を迫られている。

奥野は今後の研究において「問題を解く能力」よりも「問題を設定する能力」が重要になると考えている。

「AIの推考能力が上がり、解ける問題の範囲が圧倒的に広がりました。これまでは人間ができる範囲で問題を立てていましたが、これからは複数の領域にまたがるような巨大な問題を構想し、その推考をAIに任せるという形にシフトしていくでしょう。最終的に何が面白いか、どの方向に進むべきかを決めるのは人間であり、その『好み』や『価値観』が研究の個性を生むことになる。自分の研究が、人々を楽しませるものになればいいな、と思います」（奥野）。

次世代の研究者や学生が直面する困難を指摘しつつ、教育の重要性を説くのは包だ。「問題解決が自動化されていく中で、そもそも何が重要な問いなのかを見極める『目利き』の力がこれまで以上に問われます。若い世代にとっては、基礎的な訓練を積みながら、同時にAIが出した答えを検証する力を養わなければならない、非常に難しい時代です。研究だけでなく、こうした教育的な課題に向き合うことも、私たちの世代の役割だと感じています」（包）。

矢野は、統計学や機械学習の魅力をより広い世代に伝えていくことに意欲を見せる。「AIを道具として使うだけでなく、その背後にある数理の哲学や面白さを普及させていきたいですね。社会人へのリカレント教育も含め、統計的な思考を持つことがいかに世界を広げるかを知ってほしい。私自身、海外の研究者との共同研究を通じて異なる価値観を吸収し、常に新しいドメインに挑戦し続けることで、自分の糧にしていこうと考えています」（矢野）。

統数研という「知の交差点」がイノベーションを生み出す

3人が口を揃えて強調するのが、統数研という環境のユニークさだ。オフィシャルな組織的プロジェクトや共同研究などだけでなく、日常的な雑談や昼食時の交流から新しい研究が生まれることも少なくないという。

奥野は「統数研では『研究室の位置が近い』というだけで、全く別の専門分野の人と話ができる。学会で発表される研究はある程度形になったものですが、ここではそれ以前の本当に最前線のアイデアが、カジュアルな会話から生まれるのが強みです」と語る。

矢野もこれに同調し、「お互いに異なるツールを持った専門家が、共通の課題に対して『翻訳』を介しながら議論を深めていく。この理想的な環境が、AIという強力な翻訳ツールの登場によって、よりスムーズに機能するようになっています」と述べる。

また包も「大学のように学部で細分化されすぎず、統計数理という軸で多様な専門家が緩やかに繋がっている。この垣根の低さが、新しい知見の共有を加速させています」と語った。

先人たちが築いてきた統計数理の伝統は、今、AIという新たな翼を得て、若き探求者たちの手でさらに高く、遠くへと羽ばたこうとしている。彼らの挑戦の先には、データが単なる数字の羅列ではなく、世界の真理を映し出す鏡として、より豊かで信頼できる社会を支える未来が待っているに違いない。

2026年1月19日に開催したシンポジウム「機械学習・統計数理が切り拓くAI for Scienceの新展開」でのポスターセッションの様子。